PhD en Estadística, MSc en Analytics & Big Data, MSc en Estadística. Con 20 años de experiencia, actual director de analítica en el CNC, miembro del comité de expertos en pobreza en el DANE y consultor de la División de Estadística de la CEPAL. Ex-decano de la Facultad de Estadística USTA, ex-director de operaciones en el ICFES, PM CEV …
Proyecto precios: 35%, se permite la entrega por parejas
Proyecto satisfacción: 35%, se permite la entrega por parejas
Proyecto de tablero de control/visualización: 30%, trabajo individual
La cadena de valor de los datos
Los datos como recurso estratégico: Nuevas oportunidades, segmentos del mercado, entendimiento del consumidor
Introducción
Entender mejor el consumidor
Necesidades, expectativas
Quién es el consumidor
Cuáles son sus hábitos de consumo
Cuántos segmentos existen en el mercado
Factores relevantes en momentos de compra
Cuáles son los momentos del servicio que más afectan la satisfacción
Decisiones informadas
Inteligencia de negocios
El término fue acuñado por Gartner a mediados de los años 90, pero el concepto se origina en los años 70 con el comienzo de los sistemas de información gerenciales (MIS, Management Informations System). Hoy en día se implementan sistemas conocidos como:
CRM (Customer Relationship Management), que es un sistema diseñado para gestionar las relaciones con los clientes y mejorar las interacciones con ellos, buscando mejorar la experiencia del cliente, aumentar la lealtad y la retención, así como la optimización de procesos de ventas y marketing.
Inteligencia de negocios
El término fue acuñado por Gartner a mediados de los años 90, pero el concepto se origina en los años 70 con el comienzo de los sistemas de información gerenciales (MIS, Management Informations System). Hoy en día se implementan sistemas conocidos como:
ERP (Enterprise Resource Planning), es un sistema integrado que gestiona las operaciones internas de una empresa, desde finanzas hasta inventarios, buscando centralizar la información, mejorar la eficiencia operativa, reducir errores y duplicación de datos. Gobierno de datos
Inteligencia de negocios
El término fue acuñado por Gartner a mediados de los años 90, pero el concepto se origina en los años 70 con el comienzo de los sistemas de información gerenciales (MIS, Management Informations System). Hoy en día se implementan sistemas conocidos como:
SCM (Supply Chain Management), ayuda a gestionar y optimizar la cadena de suministro, desde el aprovisionamiento de materias primas hasta la entrega al cliente final, busca reducir costos de operación, mejorar la eficiencia logística, asegurar la calidad y disponibilidad de productos.
Inteligencia de negocios
Un sistema de inteligencia de negocios incluye herramientas y técnicas que proporcionan grandes capacidades para la transformación de los datos en conocimiento que contribuyan en la toma estratégica de decisiones que se conviertan en acciones oportunas.
¿Qué se imagina cuando le piden una estrategia de inteligencia de negocios?
¿Cuáles son los aspectos que se deberían considerar?
05:00
Inteligencia de negocios
Estaremos hablando de conceptos, técnicas y herramientas que constituyen el soporte de la inteligencia de negocio y la analítica de negocios como:
Bases de datos
Metadatos
Data Warehouse y Data Marts
Data Lakes
Integración de datos
Datos estructurados y no estructurados
Herramientas de visualización
Métodos de visualización
Analítica de datos
Modelos de aprendizaje automático
Ciencia de datos
Big Data
HACÍA EL RETO BIG DATA
Transformación digital
Haz clic para ver el video
Transformación digital
Transformación digital
Visión digital… repensar el negocio
Transformación digital
Abundancia de datos
Hype Cycle for Emerging Technologies
Aspectos clave: Adopción, madurez y aplicación
Eje X (Tiempo): Representa las etapas por las que pasa una tecnología desde su descubrimiento hasta su adopción generalizada o abandono.
Eje Y (Expectativas): Refleja el nivel actual de expectativas o entusiasmo en torno a esa tecnología.
Fases
Innovation Trigger (Desencadenante de Innovación): Marca el inicio de una tecnología emergente donde las expectativas empiezan a crecer debido a anuncios y primeros prototipos.
Peak of Inflated Expectations (Pico de Expectativas Infladas): La tecnología recibe una gran atención mediática, generando entusiasmo exagerado.
Trough of Disillusionment (Valle de Desilusión): La tecnología no cumple con las expectativas iniciales, y muchas empresas abandonan sus esfuerzos. Solo los jugadores más comprometidos continúan refinando la tecnología.
Slope of Enlightenment (Pendiente de Iluminación): La comprensión sobre la utilidad real de la tecnología comienza a aumentar.
Plateau of Productivity (Meseta de Productividad): La tecnología alcanza su madurez, demostrando beneficios concretos.
Convenciones: Gartner suele incluir una estimación del tiempo que falta para que la tecnología alcance la madurez.
Definiciones tradicionales
Definiciones tradicionales
Definiciones tradicionales
Definiciones tradicionales
Big Data se asocia con:
Grandes volúmenes de datos.
Análisis de redes sociales.
Datos en tiempo real.
Datos complejos de diferentes tipos
Se generan a gran velocidad.
Se requiere que las técnicas de analítica permitan descubrir información útil en tiempos razonables.
Estamos en un mundo de constante evolución, ¿la IA nos va a reemplazar?
Enviar una carta en papel por correo
Pedir un domicilio por teléfono
Solicitar un taxi por teléfono
Orientarse en una ruta con un mapa de papel
@tiangolo
Imagen de Caracol Radio
GPT y Modelos LLMs
El GPT (Generative Pre-trained Transformer) es un modelo de LLM (Large Language Model). Mientras que GPT-3 usaba 175 MM de parámetros usando modelos soportados en texto, GPT-4 usa 100 BN de parámetros usando modelos soportados en texto e imágenes.
Instrucciones
No pretenda que todo ocurra en un solo paso, a veces se obtienen mejores resultados precisando un prompt en cada paso.
Escriba el siguiente prompt en ChatGPT y transcriba el código a R:
“use el paquete osm de R para crear un mapa y la base de datos de droguerias en bogotá, luego use mapview para visualizar las droguerias”
Necesidades de información
Necesidades de información
Velocidad, Veracidad, Variedad, …
Modelo TESLA
Modelo TESLA
Modelo TESLA
Impacto de la IA
El uso frecuente de herramientas de IA está determinando nuestras habilidades cognitivas, fenómeno llamado “descarga cognitiva”, este fenomeno afecta negativamente nuestra capacidad de pensamiento crítico. La investigación revela que los jóvenes de 17 a 25 años son los más afectados, en comparación con los mayores de 46 años.
Eje horizontal representa el tipo de información que se está comunicando, va desde conceptos o ideas (izq) hasta datos concretos (der).
Eje vertical describe la interacción que los usuarios tienen con la visualización. Las visualizaciones declarativas cuentan una historia clara, mientras que la comunicación exploratoria permite a los usuarios interactuar con los datos para llegar a sus propias interpretaciones.
Con el conjunto de datos artificial study realice un gráfico de cajas que presente el promedio de la variable score por cada tratamiento (asigne un color diferente a las barras según el tratamiento)
library(pacman)p_load(tidyverse, tidyplots)g1 <- study |>tidyplot(x = treatment, y = score, color = treatment, width =100, height =100) |>add_boxplot()
Algunos ejemplos
Ahora presente las diferencias estadísticas:
library(pacman)p_load(tidyverse, tidyplots)g1 <- study |>tidyplot(x = treatment, y = score, color = treatment, width =100, height =100) |>add_boxplot() |>add_test_pvalue(ref.group =1)
Algunos ejemplos
Haga un gráfico que presente el promedio del score por grupo y tipo de dosis
g2 <- study |>tidyplot(x = group, y = score, color = dose, width =100, height =100) |>add_mean_bar(alpha =0.4) |>add_mean_dash() |>add_mean_value()
Business Analytics
Modelos para generar valor
Business Analytics (BA) es el uso de datos, análisis estadístico y modelos para apoyar la toma de decisiones estratégicas y operativas en las organizaciones. Su utilidad radica en transformar datos en insights accionables que permitan optimizar procesos, identificar oportunidades y mejorar la competitividad empresarial.
Modelos para generar valor
Predicción: Anticipar tendencias y comportamientos futuros (metas, mercado potencial, proyecciones).
Diagnóstico: Identificar causas subyacentes de problemas o patrones (análisis de la caída en ventas o de la satisfacción del cliente). 3 Prescripción: Proponer acciones óptimas para alcanzar objetivos (estrategias de precios, asignación de recursos).
Descriptivo: Resumir datos para entender comportamientos (percepción, hábitos).
Modelos para generar valor
Modelos de Predicción de Churn (Deserción):
Regresión Logística: Predecir la probabilidad de que un cliente abandone.
Análisis de Supervivencia: Identifica el tiempo hasta que un cliente abandona.
Árboles de Decisión: Identificar reglas simples que expliquen la deserción.
Modelos de Machine Learning: Redes neuronales, Random Forest, SVM, modelos basados en XGBoost o LightGBM.
Análisis RFM (Recency, Frequency, Monetary): Segmentación de clientes según comportamiento histórico.
Modelos para generar valor
Optimización de Campañas de Marketing:
Clustering: Segmentación de clientes para personalizar mensajes o definir estrategias.
Modelos de Propensión: Para identificar la probabilidad de que un cliente responda a una campaña.
A/B Testing: Evaluar la efectividad de diferentes campañas.
Sistemas de Recomendación: Filtrado colaborativo y basado en contenido para ofertas personalizadas (busqueda en redes sociales).
Modelos para generar valor
Satisfacción y Experiencia del Cliente:
Análisis de Sentimientos (NLP): Identificar opiniones positivas o negativas en encuestas o redes sociales.
Análisis de redes semánticas: Descubrir temas recurrentes en comentarios de clientes.
Modelos de asociación: Relacionar la satisfacción con factores específicos.
Modelos para generar valor
Gestión de Precios y Estrategias de Revenue Management
Elasticidad de Precios: Modelos Regresión Logística o Lineal para entender el impacto de cambios de precios.
Optimización de Precios Dinámicos: Programación matemática o Machine Learning (pasajes áereos, tarifa dinámica de uber).
Modelos de Simulación: Para predecir ingresos en diferentes escenarios (logit anidado).
Utilidad: Maximizar ingresos mediante precios optimizados según la demanda y competencia (CBC).
Decisiones sobre precios
Van Westendorp, Gabor-Granger, Newton-Miller-Smith, Conjoint Analysis.
El medidor de sensibilidad al precio (PSM) fue propuesto por Peter Van Westendorp (1976). La técnica permite determinar el rango de precios aceptable y el precio óptimo de los productos.
Newton, Miller y Smith (1993) ampliaron el PSM con dos preguntas de seguimiento que se pueden utilizar para generar curvas de demanda de productos y curvas de ingresos.
Metodología
La competencia debe ser evaluada con las características más similares (W, Color de luz,…)
Aplicación
Aplicación
PROYECTO 1: SENSIBILIDAD DE PRECIOS
VALOR: 35%
FECHA DE ENTREGA: Próximo XXX.
FORMA DE ENTREGA: PLATAFORMA
BRIEF
Objetivo: Determinar el rango de precio óptimo para un NUEVO producto en el mercado.
Target: Consumidores de la categoría
Cobertura: La debe especificar el estudiante.
PROYECTO 1: SENSIBILIDAD DE PRECIOS
Muestra: Al menos 20 respuestas (Nota máx. de 4.0). Por cada encuesta adicional se sumará 0.1.
Preguntas (Análisis): Mínimo agrado, intención de compra y las 4 de precios.
Resultados esperados: Presentación comercial (Power Point, canvas, Beamer, etc.) con ficha técnica de la investigación (Investigar), contextualización del producto, gráfico VW, rango de precios y conclusiones con recomendaciones. Debe entregar la Base de datos y el enlace con el que se realizó la encuesta.
*La estética y forma de presentación tienen una ponderación en la nota
Estructuras de datos
Proceso de ETL: Extracción, Transformación y Carga
Bases de datos relacionales
Estructura de datos que cumple el modelo entidad-relación (objeto–atributos).
Es un conjunto de tablas estructuradas en registros (filas) y campos (variables, columnas), que se vinculan entre sí por un campo en común (índice).
El software que gestiona la BD se denomina SGDBR–Sistema Gestor de la Base de Datos Relacional(RDBMS -Relational Data Base Management System). Ej.: PostgreSQL, Oracle, MySQL, DB2, SQL Server, Access…
Bases de datos relacionales
Bases de datos relacionales
Conceptos clave
Tabla de datos: Estructura de datos de dos dimensiones.
Base de datos: Conjunto de tablas de datos que generalmente pertenecen al mismo contexto
Cubo OLAP: Base de datos multidimensional para análisis interactivo.
Bases de datos NoSQL: Sistemas de almacenamiento que no cumplen el modelo entidad-relación.
Metadatos: recoge la información de toda la estructura y datos
Dato vs Información
El DW es el motor del Business Intelligence (BI) y está diseñado para favorecer el análisis y la divulgación eficiente de datos.
El BI usa los datos de una empresa para facilitar la toma de decisiones.
DATOS -> INFORMACIÓN -> CONOCIMIENTO
Características de un BI:
Accesibilidad a la información
Apoyo a la toma de decisiones
Orientación al usuario final
Aplicación: Marketing Directo
¿Qué significa?
Es la comunicación a través de algunos medios con el fin de generar una reacción.
Aplicación: Marketing Directo
Objetivos
Ganar clientes y fomentar la fidelidad de los mismos. El objetivo de la fidelidad de los clientes puede estar dirigido a que repitan la compra o a mantener la adquisición permanente de un producto.
Metodología
Hacer un continuo seguimiento de los clientes con el fin de detectar y responder: Cómo están agrupados?. Quiénes son?. Donde están? Cuáles son los mejores? Alarmas sobre quiénes están en riesgo, etc..
Segmentación
Es el proceso de dividir una población en grupos más pequeños que tengan características y necesidades semejantes dentro de ellos y distintas entre ellos.
Se identifican grupos con alto nivel de relación para definir un plan de contactos adecuado, con el mensaje correcto, a través de canales precisos, a los clientes adecuados.
Resumen de variables cuantitativas
Nuestros datos
Segmentación - Marketing Directo
Identifique el nivel de riesgo de su negocio ¿de cuántos dependo hoy?. Implemente estrategias para cuidar esos clientes importantes. Identifique, ¿Quiénes son?, ¿Dónde están?.
Segmentación RFM
Adaptado de Woolf, B (2002). Loyalty Marketing: The Second Act
Segmentación RFM
Adaptado de Woolf, B (2002). Loyalty Marketing: The Second Act
Segmentación RFM
Adaptado de Woolf, B (2002). Loyalty Marketing: The Second Act
Segmentación RFM
Interpretación
¿Qué significa que el resultado sea 111?
¿Qué significa que el resultado sea 211?
¿Cuál debería ser la estrategia de retención en cada segmento?
03:00
Visualización: Mapa de segmentación
Visualización: Mapa de acción
Ejercicio
Tu turno: Use los conjustos de datos “rfm_transacciones.xlsx” y “rfm_ejemplo.xlsx” para hacer una segmentación RFM. Discuta sobre las estrategias que aplicaría.
15:00
Satisfacción y Experiencia del Cliente
Los modelos de satisfacción y lealtad son herramientas analíticas utilizadas para comprender y predecir el comportamiento de los clientes, evaluando cómo diferentes factores influyen en su satisfacción con un producto o servicio y en su disposición a permanecer fieles a una marca o empresa.
Esquema de medición
Matriz de acción
Formulación del modelo
Sea \(\mathcal{D}=\{(y_i, \mathbf{x}_i): i=1,\ldots,n\}\), con \(y_i\) la \(i\)-ésima respuesta medida en una escala continua; \(\mathbf{x}_i=(x_{i1},\ldots,x_{ip})^t \in \mathbb{R}^p\) es el vector de variables predictoras; y \(n\)\((\gg p)\) es el tamaño de la muestra. El modelo lineal se especifica así:
Use los comandos skim() y glimpse() para explorar el conjuto de datos.
Modelo lineal
desempe <- datos |>select(Pp1f, Pp2e, Pp3h, Pp4e) |>summarise(across(everything(), ~mean(.))) |>pivot_longer(everything(), names_to ="term", values_to ="desempeño")general <-lm(Pp5 ~ Pp1f + Pp2e + Pp3h + Pp4e -1,data = datos) |>tidy() |>mutate(score = estimate * (1- p.value)) |>mutate(importancia =round(100* score /sum(score), 1)) |>left_join(desempe, by ="term") |>select(term, importancia, desempeño)res <- general |>mutate(impacto =factor(case_when( importancia <mean(importancia) & desempeño >6~1, importancia <mean(importancia) & desempeño <=6~2, importancia >=mean(importancia) & desempeño <=6~3, importancia >=mean(importancia) & desempeño >6~4),levels =1:4, labels =c("Mantener", "Mejorar en el largo plazo","Acción Inmediata", "Explotar"))) |>mutate(names =c("Red de cajeros", "Servicio de Asesoría", "Servicio de caja", "Servicios Web"))
Matriz de acción
paletaAEML <-c("Acción Inmediata"="red","Explotar"="blue","Mantener"="purple","Mejorar en el largo plazo"="darkorange")res |>ggplot(aes(x= importancia, y= desempeño)) +geom_point(aes(shape=impacto, color=impacto)) +labs(x="Importancia", y="Desempeño", title ="GENERAL") +ylim(4.5,7) +xlim(9, 45) +geom_vline(xintercept =mean(res$importancia), color ="black", linetype =2) +geom_hline(yintercept =6.0, color ="black", linetype =2) +geom_text_repel(aes(label =str_wrap(names, 30), colour = impacto), size=3.5, segment.color ="grey50") +scale_colour_manual(values = paletaAEML) +theme_bw() +theme(axis.text =element_text(face ="bold"), legend.position ="none") +theme(plot.title =element_text(hjust =0.5), plot.subtitle =element_text(hjust =0.5)) +annotate("label", x=40, y =5.0, label ="ACCIONAR DE FORMA \nINMEDIATA", size =5, color ="red", label.size =0, label.padding =unit(0.15, "lines"), label.r =unit(0.15, "lines"), fill =alpha("red", 0.1), fontface ="bold")+annotate("label", x=13, y =5.0, label ="MEJORAR EN EL\nLARGO PLAZO", size =5, color ="darkorange", label.size =0, label.padding =unit(0.15, "lines"), label.r =unit(0.15, "lines"), fill =alpha("darkorange", 0.1), fontface ="bold") +annotate("label", x=13, y=6.8, label ="MANTENER", size =5, color ="purple", label.size =0, label.padding =unit(0.15, "lines"), label.r =unit(0.15, "lines"), fill =alpha("purple", 0.1), fontface ="bold") +annotate("label", x=40, y=6.8, label ="EXPLOTAR", size =5, color ="blue", label.size =0, label.padding =unit(0.15, "lines"), label.r =unit(0.15, "lines"), fill =alpha("blue", 0.1), fontface ="bold") -> mapa
Matriz de acción
PROYECTO 2: SATISFACCIÓN
VALOR: 35%
FECHA DE ENTREGA: Próximo XXX.
FORMA DE ENTREGA: PLATAFORMA
BRIEF
Objetivo: Determinar la importancia de los momentos de verdad y atributos dentro de un target de clientes de un servicio.
Target: Clientes del servicio
Cobertura: La debe especificar el estudiante.
PROYECTO 2: SATISFACCIÓN
Muestra: Al menos 30 respuestas (Calificación de 4.0). Por cada respuesta adicional 0.2 hasta completar una nota de máximo 10.
Momentos: Medir al menos 7 aspectos generales o del mismo momento de verdad.
Resultados esperados: Presentación comercial con: ficha técnica, link del instrumento, Explicación del ciclo del servicio, Importancia de los momentos/atributos, Desempeño del modelo, Matriz de acción. Base de datos. Conclusiones y recomendaciones.
*La estética y forma de presentación tienen una ponderación en la nota
GRACIAS!
Referencias
Howson, C. (2013). Successful Business Intelligence, Second Edition: Unlock the Value of BI & Big Data. 2d Edition. McGraw Hill.
Sherman, R. (2014). Business Intelligence Guidebook: From Data Integration to Analytics. Morgan Kaufmann
Sinha, C. (2024). Mastering Power BI: Build business intelligence applications powered with DAX calculations, insightful visualizations, advanced BI techniques, and loads of data sources. BPB Publications.
Woolf, B. P. (2002). Loyalty marketing: The second act. Teal Books.